卡塔尔研究院开发ADAM:首个专门评估AI传记推理能力的综合框架
这项由卡塔尔计算研究院的Ehsaneddin Asgari教授领导、联合普林斯顿大学、弗吉尼亚理工和印度阿米提大学共同完成的开创性研究,于2025年9月发表在arXiv预印本平台(编号:arXiv:2509.22991v1)。有兴趣深入了解的读者可以通过该编号
这项由卡塔尔计算研究院的Ehsaneddin Asgari教授领导、联合普林斯顿大学、弗吉尼亚理工和印度阿米提大学共同完成的开创性研究,于2025年9月发表在arXiv预印本平台(编号:arXiv:2509.22991v1)。有兴趣深入了解的读者可以通过该编号
在机器人与智能体领域,一个老大难问题是:当你让机器人 “把黄碗放进白色空篮子” 或 “从微波炉里把牛奶取出来放到餐桌上” 时,它不仅要看懂环境,更要解释指令、规划路径 / 可操作区域,并把这些推理落实为准确的动作。目前,很多 VLA(Vision-Langua
10月15日,德国农工大学、德克萨斯大学奥斯汀分校和普渡大学的研究团队在arXiv上发表了一篇论文,提出并测试了“LLM脑腐假说”(LLM Brain Rot Hypothesis)。研究显示,经垃圾数据训练后,Llama 8B模型的推理能力下降了23.6%,
近日,来自普渡大学、德克萨斯大学、新加坡国立大学、摩根士丹利机器学习研究、小红书 hi-lab 的研究者联合提出了一种对离散扩散大语言模型的后训练方法 ——DiscreteDiffusion DivergenceInstruct(DiDi-Instruct)。
最近,看了一档推理类的综艺节目,名字叫做《开始推理吧》。该节目已经播了三季,每一季都给大家带来了不一样的观看体验。
据行业调研显示,82% 的企业计划在未来三年内引入 AI 相关技术,但很多人仍混淆 Agentic AI 与 AI Agent 这两个概念。事实上,二者代表了 AI 应用的两种截然不同的路径:前者是具备战略思维的统筹者,后者是高效的执行者。厘清二者的技术边界,
十年前,扫码支付改变了中国人的生活。最近,一款名为“灵光”的App,或许正在改变人与信息的交互方式。它由支付宝(杭州)数字服务技术有限公司开发,最近在腾讯应用宝和vivo商店悄然上线。
当今人工智能领域最大的谎言是“自我修正”证明了大型语言模型(LLM)能够推理。但事实并非如此:它只是在取平均值。
语言模型遭遇严重的位置偏见,即模型对不同上下⽂位置的敏感度不⼀致。模型倾向于过度关注输⼊序列中的特定位置,严重制约了它们在复杂推理、⻓⽂本理解以及模型评估等关键任务上的表现。
这是一个非常前沿且具有高度行业关注度的话题。以下是对这一问题的详细分析,帮助你理解DeepSeek的创新背景、技术潜力以及其在突破大模型瓶颈方面的可能影响。
蚂蚁开源团队出了个叫Ring-1T的模型,直接在2025年AIME测试里拿了93.4分,这个成绩快赶上人类顶尖选手了。
蚂蚁开源团队推出的 Ring-1T 模型,为这个长期存在的疑问提供了最具说服力的实证。不同于以往依赖海量数据“记忆”答案的语言模型,Ring-1T 试图让 AI 在复杂问题中真正“推理”出答案。
如何让一个并不巨大的开源大模型,在面对需要多步检索与复杂逻辑整合的问题时,依然像 “冷静的研究员” 那样先拆解、再查证、后归纳,最后给出可核实的结论?
模型 推理 spotlight ne acesearcher 2025-10-24 12:32 2
实验结果显示,与传统的在线策略RLVR(基于可验证奖励的强化学习)方法相比,ExGRPO在不同基准上均带来了一定程度的性能提升。
这是一个高性能异构推理框架,专注于高效利用底层GPU、CPU、内存等多样化算力,让大模型在更低算力、更灵活的硬件架构上高效运行,项目论文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybri
推理 开源 范式 清华 ktransformers 2025-10-23 09:13 3
当你在网上搜索"哪部电影的导演出生更晚"这样的问题时,你期望得到的不仅仅是一个简单的答案,而是一个经过深思熟虑、有理有据的回应。然而,目前的AI搜索助手往往在处理这类需要多步推理的复杂问题时力不从心。埃默里大学的研究团队最近在2025年神经信息处理系统大会(N
模型 推理 ai模型 侦探 acesearcher 2025-10-23 05:52 4
电子发烧友网报道(文/莫婷婷)近日,上海证券交易所公告显示,沐曦集成电路(上海)股份有限公司(简称“沐曦”)将在10月24日迎来科创板上市委审议。这家成立于2020年的国产GPU新锐,估值已达210亿元。而在此前,另一家国产GPU公司摩尔线程已于9月26日率先
2025年10月14日,由图灵奖得主Yoshua Bengio领导的《2026年国际人工智能安全报告》发布了首次关键更新。这份由来自30个国家及联合国、欧盟、OECD等国际组织专家共同完成的报告,聚焦AI领域在短短数月间发生的重大变化,揭示了技术进步与风险管控
被黑夜笼罩的穷途末路之际,琳迷失在异形者居住的迷之街道·吕根贝尔格。
这项由上海交通大学的郝锦坤、上海人工智能实验室的梁乃富和许旭东等研究人员组成的团队在2025年9月发表的研究,首次提出了一个革命性的解决方案。该论文发表在计算机视觉顶级会议上,论文编号为arXiv:2509.22281v1,为机器人训练开辟了全新道路。